یادگیری جمعی در رانش مفهوم با وجود داده نامتوازن

پایان نامه
چکیده

در سال های اخیر‏، جریان داده ها‏، توجه بسیاری از محققان را در حوزه های مختلف‎ ‎‎به خود جلب کرده است. از نظر هر سامانه، جریان داده ها، داده هایی با حجم بسیار بالا می باشند که به صورت افزایشی و با نرخ بالا به آن سامانه وارد می شوند. به دلیل حجم بسیار بالای این نوع داده ها، ذخیره سازی آن ها امری مقرون به صرفه نیست.‎‎‎از مهم ترین چالش های موجود در یادگیری جریان داده ها، تغییر الگوی توزیع داده ها در طول زمان بوده که به‎‎ آن رانش مفهوم نیز اطلاق می شود. فرآیند رانش مفهوم یک رخداد طبیعی در دنیای واقعی بوده که در طول زمان باعث تغییر در مفهوم داده می شود. بنابراین مدلی که از روی این داده ها در زمان مشخصی ساخته می شود، به مرور زمان دقت خود را از دست داده و دیگر قابل استفاده نیست.‎‎ از طرفی دیگر، در دنیای امروزی، مسئله طبقه بندی داده های نامتوازن از اهمیت خاصی برخوردار است. توزیع داده ها در داده های نامتوازن به گونه ای است که طبقه ای‎ که از نظر دامنه کاربرد، اهمیت زیادی دارد (طبقه اقلیت)‏، شامل تعداد نمونه های کمتری نسبت به طبقه ای است که از اهمیت خاصی برخوردار نیست (طبقه اکثریت‎‎). زمانی که از روش های معمول داده کاوی‏ برای طبقه بندی داده های نامتوازن استفاده می شود، به علت تعداد بسیار کم نمونه های طبقه اقلیت، بیشتر نمونه های این طبقه، در طبقه اکثریت قرار گرفته و در نتیجه طبقه اقلیت که اهمیت و کاربرد زیادی دارد، دارای دقت پایینی خواهد شد.

منابع مشابه

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

ارائه راه کاری برای یادگیری از داده های نامتوازن چندکلاسه با استفاده از الگوریتم های یادگیری جمعی

پردازش مجموعه داده های نامتوازن در بسیاری از کاربردهای دنیای واقعی، گسترده شده اند. این مسئله زمانی به وقوع می پیوندد که تعداد نمونه های یک یا چندین کلاس موجود در مجموعه داده، نسبت به تعداد نمونه های سایر کلاس ها کمتر باشند. این مشکل به وجود چولگی و عدم توازن در توزیع مجموعه داده ای مربوط شده و باعث ایجاد مشکلات برای بسیاری الگوریتم های معمول یادگیری ماشین می شود. در حقیقت، هدف اصلی یادگیری، به...

فرضیه‌هایی از مفهوم فضای جمعی

تا قبل از ورود استعمار در سال ۱۸۸۱، کشور تونس اساساً بر کشاورزی استوار بود. علی‌رغم یکجانشین شدن زودهنگام جمعیت کوچ‌نشین، مراکز شهری نسبتاً مهم، به استثنای پایتخت یعنی شهر تونس، نادر بودند. شهر تونس که با الگوی شهرهای عربی سرزمین‌های مغربی ساخته شده بود، همزمان مرکز مذهبی، سیاسی و اقتصادی (خصوصاً تجاری) کشور به شمار می‌آمد و تحت فرمان «بی»1بود. شهر از طریق دروازه‌ها به جهات اصلی گشوده ...

متن کامل

بهبود کلاس بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین

در دنیای امروز مسئله کلاس بندی داده های نا متوازن از اهمیت خاصی برخوردار است . کلاس بندی این داده ها به گونه ای است که ، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد (کلاس اقلیت ) شامل تعداد حالات کمتری نسبت به کلاسی است که از اهمیت خاصی برخوردار نیست (کلاس اکثریت). به این مجموعه داده ها داده های نامتوازن می گویند. روش های مختلفی برای کلاس بندی این نوع داده ها ارائه شده است .در کلاس بندی این د...

دسته بندی مجموعه داده های نامتوازن با استفاده از روش های یادگیری ماشین

یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه ه...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی (نوشیروانی) بابل - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023